Gestion de l’incertitude pour l’optimisation en ligne d’un gestionnaire de dialogues parlés à grande échelle basé sur les POMDP

نویسندگان

  • Lucie Daubigney
  • Senthilkumar Chandramohan
  • Matthieu Geist
  • Olivier Pietquin
چکیده

Résumé : L’utilisation de l’apprentissage par renforcement (AR) fait maintenant partie de l’état de l’art dans le domaine de l’optimisation de gestionnaires de dialogues parlés. Cependant avec cette méthode, entraîner un gestionnaire de dialogues requiert la génération de nombreuses données. C’est pourquoi beaucoup d’attention a été portée à la simulation d’utilisateurs ces dix dernières années. L’optimisation est donc faite avant de confronter le système à des utilisateurs réels et l’apprentissage est soit stoppé ou soit très lent durant l’utilisation pratique. Pendant ce temps-là, la recherche en AR a développé des algorithmes efficaces en termes d’échantillons. Par exemple les processus gaussiens pour l’AR ont récemment été appliqués aux gestionnaires de dialogues. Pour augmenter la vitesse d’apprentissage, l’incertitude sur les estimations calculées durant l’apprentissage est utilisée pour diriger l’exploration. Une comparaison entre différents schémas d’exploration montre que des améliorations significatives peuvent être apportées et qu’une optimisation en ligne rapide et sûre est possible, même sur une tâche complexe.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Characterizing the topology of an urban wireless sensor network for road traffic management Caractérisation de la topologie d’un réseau urbain de capteurs sans fil pour la gestion de la circulation routière

Dans un futur proche, les réseaux sans fil seront l’une des technologies clés pour la gestion de la circulation routière dans les villes intelligentes. Les véhicules et systèmes routiers devraient être reliés, par exemple à travers l’extension IEEE 802.11p. En parallèle, nous pouvons nous attendre à ce que les feux de circulation et les signaux routiers aient leur place dans cette architecture,...

متن کامل

Mémoires partagées distribuées pour systèmes dynamiques à grande échelle

La plupart des systèmes distribués modernes sont à la fois à grande échelle et dynamiques. Cet article met en avant le passage des systèmes distribués classiques aux systèmes dynamiques à grande échelle. Bien que la réplication d’un objet (i.e., d’une donnée) à plusieurs endroits du réseau tolère les défaillances, cette technique implique un coût considérable à chaque modification de la valeur ...

متن کامل

Prise de décision en temps-réel pour des POMDP de grande taille

RÉSUMÉ. Cet article présente une méthode d’approximation pour les processus décisionnels de Markov partiellement observables (POMDP) qui est basée sur une recherche en profondeur pour la planification dans un environnement temps-réel dynamique. L’idée de base de notre approche, appelée RTBSS (Real-Time Belief Space Search), est d’éviter de calculer des politiques complètes pour des POMDPs. Cett...

متن کامل

[Upper airway management in obsterics: results of a French survey].

Au rédacteur en chef, La réalisation d’une anesthésie générale (AG) chez une parturiente est associée à un risque significatif d’intubation orotrachéale difficile et d’inhalation. Toute parturiente audelà de 16 à 21 semaines d’aménorrhée doit être considérée comme à risque d’estomac plein. Par conséquent, les experts d’anesthésie obstétricale recommandent l’intubation orotrachéale systématique ...

متن کامل

De l’analyse des pratiques à la construction d’un modèle d’évolution des systèmes d’élevage : application à la région Nordeste du Brésil

L’objectif de cette étude a été d’analyser les évolutions des activités d’élevage à l’échelle d’une région de vastes dimensions, qu’elle corresponde à une réalité administrative ou agro-écologique, en intégrant les dimensions techniques, économiques, sociales et spatiales qui interviennent dans les processus décisionnels. Pour identifier et interpréter le changement, les auteurs se sont intéres...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2011